ارائه یک الگوریتم خوشه بندی برای داده های دسته ای با ترکیب معیارها

Authors

مریم نبی لو

maryam nabiloo نگین دانشپور

negin daneshpour shahid rajaee teacher training universityتهران- لویزان- خیابان شعبانلو- دانشگاه تربیت دبیر شهید رجایی

abstract

خوشه بندی یکی از تکنیک های اصلی داده کاوی است. خوشه بندی فرایندی است که مجموعه داده ها را داخل گروه هایی طبقه بندی می کند. در خوشه بندی داده های موجود در یک خوشه بیشترین شباهت را به هم دارند و داده های موجود در دو خوشه متفاوت بیشترین تفاوت را با هم دارند. الگوریتم های خوشه بندی با توجه به نوع داده ها به دو دسته تقسیم می شوند: الگوریتم های خوشه بندی داده های عددی و الگوریتم های خوشه بندی داده های دسته ای. الگوریتم های خوشه بندی داده های دسته ای به دلیل ماهیت و کاربرد این داده ها نسبت به الگوریتم های خوشه بندی داده های عددی از اهمیت بالایی برخوداراند. هر یک از این الگوریتم ها با توجه به نوع داده (عددی یا دسته ای) از معیارهای شباهت متفاوتی در خوشه بندی استفاده می کنند. در این مقاله یک روش جدید در خوشه بندی با استفاده از ترکیب معیارهای شباهت overlay و jaccard روی یک الگوریتم سلسله مراتبی برای داده های دسته ای پیشنهاد می شود. معیار overlay تفاوت بین داده ها را به صورت صفر و یک بیان می کند که این امر باعث از بین رفتن برخی اطلاعات مربوط به داده ها می شود. معیار jaccard نیز اگر به تنهایی برای اندازه گیری شباهت میان داده ها استفاده گردد بیشتر خوشه ها در یک ناحیه از مجموعه داده ها انتخاب می شوند. بنابراین در این مقاله ترکیبی از دو معیار به کار رفته است.آزمایشات نشان می دهد که روش ارائه شده در این مقاله توانسته است که نتایج حاصل از خوشه بندی را بهبود ببخشد و بطور متوسط 10 درصد بهبود بر روی هر فاکتور ارزیابی داشته است.

Upgrade to premium to download articles

Already have an account?login

similar resources

ارائه ی یک مدل جهت دسته‌بندی متون فارسی با استفاده از ترکیب روش های دسته بندی

برای دستهبندی متن از تکنیکهای استخراج اطلاعات، پردازش زبان طبیعی و یادگیری ماشین به طور وسیع استفاده می‌شود به طور کلی هدف یک دسته بند متون، دستهبندی اسناد در قالب تعداد معینی از دستههای از پیش تعیین شده میباشد. هر سند می‌تواند در یک، چند و یا هیچ دسته‌ای قرار بگیرد. در مورد هر سند به این سؤال پاسخ داده خواهد شد که این سند در کدام یک از دستهها قرار می‌گیرد. این موضوع می‌تواند در قالب یک ی...

full text

ارائه ی یک مدل جهت دسته‌بندی متون فارسی با استفاده از ترکیب روش های دسته بندی

برای دستهبندی متن از تکنیکهای استخراج اطلاعات، پردازش زبان طبیعی و یادگیری ماشین به طور وسیع استفاده می شود به طور کلی هدف یک دسته بند متون، دستهبندی اسناد در قالب تعداد معینی از دستههای از پیش تعیین شده میباشد. هر سند می تواند در یک، چند و یا هیچ دسته ای قرار بگیرد. در مورد هر سند به این سؤال پاسخ داده خواهد شد که این سند در کدام یک از دستهها قرار می گیرد. این موضوع می تواند در قالب یک ی...

full text

ارائه یک روش ترکیب دسته بندی کننده ها بر اساس خوشه بندی داده ها

دسته بندی یا تعیین نوع کلاس در یادگیری ماشین از اهمیت بسزایی برخوردار است. در واقع طبقه بندی اطلاعات روشی است که در همه علوم خواه یا ناخواه استفاده میشود. در علم کامپیوتر روش های بسیاری برای این مهم وجود دارد. هر روش نقطه ضعف و نقطه قوت خاص خود را دارد. اما در بعضی مواقع تنها یک روش برای طبقه بندی اطلاعات کافی نیست و مجبوریم که از چند روش و بررسی نتایج آنها این کار را انجام دهیم. راه های زیا...

بهبود الگوریتم خوشه بندی مشتریان برای توزیع قطعات یدکی با رویکرد داده کاوی (k-means)

Customer classification using k-means algorithm for optimizing the transportation plans is one of the most interesting subjects in the Customer Relationship Management context. In this paper, the real-world data and information for a spare-parts distribution company (ISACO) during the past 36 months has been investigated and these figures have been evaluated using k-means tool developed for spa...

full text

نحوه خوشه بندی آماری داده های شکل

اخیرا به کارگیری ابزارهای آمار چندمتغیره برای تحلیل داده هایی که به صورت هندسی تصادفی هستند مورد اقبال محققین علوم کاربردی قرار گرفته است. آمارشکل به عنوان شاخه جدیدی از هندسه تصادفی شامل مجموعه ای از چنین داده هایی است. با این حال، چون چنین داده هایی ماهیت غیراقلیدسی دارند نحوه تطبیق ابزارهای مرسوم چندمتغیره برای تحلیل آماری مناسب آنها تا حدودی واضح نیست. در این مقاله نحوه خوشه بندی داده های آ...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}

Journal title:

محاسبات نرم

جلد ۵، شماره ۱، صفحات ۱۴-۲۵

Keywords

داده کاوی خوشه بندی داده های دسته ای معیار فاصله معیار چگالی.

Hosted on Doprax cloud platform doprax.com